<!DOCTYPE HTML>
<html>

<head>
	<link rel="bookmark"  type="image/x-icon"  href="/img/logo.jpg"/>
	<link rel="shortcut icon" href="/img/logo.jpg">
	
			    <title>
    北望你的安
    </title>
    <meta charset="utf-8" />
    <meta name="viewport" content="width=device-width, initial-scale=1, user-scalable=no" />
    <link rel="stylesheet" href="/css/mic_main.css" />
    <link rel="stylesheet" href="/css/dropdownMenu.css" />
    <meta name="keywords" content="北望你的安" />
    
    	<script async src="//busuanzi.ibruce.info/busuanzi/2.3/busuanzi.pure.mini.js"></script>
	 
    <noscript>
        <link rel="stylesheet" href="/css/noscript.css" />
    </noscript>
    <style type="text/css">
        body:before {
          content: ' ';
          position: fixed;
          top: 0;
          background: url('/img/bg.jpg') center 0 no-repeat;
          right: 0;
          bottom: 0;
          left: 0;
          background-size: cover; 
        }
    </style>

			    
  


    <script src="/js/jquery.min.js"></script>
    <script src="/js/jquery.scrollex.min.js"></script>
    <script src="/js/jquery.scrolly.min.js"></script>
    <script src="/js/skel.min.js"></script>
    <script src="/js/util.js"></script>
    <script src="/js/main.js"></script>
	
</head>
    
		
<!-- Layouts -->



<!--  代码渲染  -->
<link rel="stylesheet" href="/css/prism_coy.css" />
<link rel="stylesheet" href="/css/typo.css" />
<!-- 文章页 -->
<body class="is-loading">
    <!-- Wrapper 外包 s-->
    <div id="wrapper" class="fade-in">
        <!-- Intro 头部显示 s -->
        <!-- Intro 头部显示 e -->
        <!-- Header 头部logo start -->
        <header id="header">
    <a href="/" class="logo">Krystalan</a>
</header>
        <!-- Nav 导航条 start -->
        <nav id="nav" class="special" >
            <ul class="menu links" >
			<!-- Homepage  主页  --> 
			<li >
	            <a href="/" rel="nofollow">主页</a>
	        </li>
			<!-- categories_name  分类   --> 
	        
	        <li class="active">
	            <a href="#s1">分类</a>
	                    <ul class="submenu">
	                        <li>
	                        <a class="category-link" href="/categories/%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0/">强化学习</a></li><li><a class="category-link" href="/categories/%E6%95%B0%E5%AD%A6/">数学</a></li><li><a class="category-link" href="/categories/%E7%AE%97%E6%B3%95/">算法</a></li><li><a class="category-link" href="/categories/%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86/">自然语言处理</a></li><li><a class="category-link" href="/categories/%E9%9A%8F%E7%AC%94/">随笔</a>
	                    </ul>
	        </li>
	        
	        <!-- archives  归档   --> 
	        
	        
		        <!-- Pages 自定义   -->
		        
		        <li>
		            <a href="/tags/" title="标签">
		                标签
		            </a>
		        </li>
		        
		        <li>
		            <a href="/gallery/" title="相册">
		                相册
		            </a>
		        </li>
		        


            </ul>
            <!-- icons 图标   -->
			<ul class="icons">
                    
                    <li>
                        <a title="github" href="https://github.com/krystalan" target="_blank" rel="noopener">
                            <i class="icon fa fa-github"></i>
                        </a>
                    </li>
                    
                    <li>
                        <a title="500px" href="https://www.zhihu.com/people/krystalzhu-an" target="_blank" rel="noopener">
                            <i class="icon fa fa-500px"></i>
                        </a>
                    </li>
                    
			</ul>
</nav>

        <div id="main" >
            <div class ="post_page_title_img" style="height: 25rem;background-image: url(/img/12.jpg);background-position: center; background-repeat:no-repeat; background-size:cover;-moz-background-size:cover;overflow:hidden;" >
                <a href="#" style="padding: 4rem 4rem 2rem 4rem ;"><h2 >2019 EMNLP 文摘DEMO</h2></a>
            </div>
            <!-- Post -->
            <div class="typo" style="padding: 3rem;">
                <p><img src="/images/Papers/DemoSum/1.jpg" alt="论文题目"><br>这是一篇2019EMNLP的DEMO Paper，有19名作者。<br>论文地址：<u><a href="https://arxiv.org/abs/1908.11152" target="_blank" rel="noopener">https://arxiv.org/abs/1908.11152</a></u>  </p>
<h1 id="1-动机"><a href="#1-动机" class="headerlink" title="1.动机"></a>1.动机</h1><p>科学文献数量不断增加，在计算机科学领域，出现了一些新工具用于监控、探索、讨论和评论论文。然而研究人员仍有大量信息需要更新，而对论文产生摘要则可以通过为研究者提供足够的信息来缓解这一问题。<strong>所以本文设计了一个对CS论文产生相应摘要的系统：IBM Science Summarizer。</strong><br>目前已有的摘要模型都不是很适用于这一复杂场景（科技论文有着较高的长度与复杂度）。  </p>
<h1 id="2-系统框架"><a href="#2-系统框架" class="headerlink" title="2.系统框架"></a>2.系统框架</h1><p><img src="/images/Papers/DemoSum/2.jpg" alt="论文题目"><br>ISS（IBM Science Summarizer）系统分为两部分<br>第一部分为上图（a）部分，用于解析和索引arxiv和ACL anthology上的论文内容。<br>第二部分为上图（b）部分，一个搜索引擎，支持搜索、探索和产生摘要。<br>大家也可以去这个网站感受一下ISS：<u><a href="https://ibm.biz/sciencesum" target="_blank" rel="noopener">https://ibm.biz/sciencesum</a></u>  </p>
<p>这个系统包含了270K篇从arxiv和ACL anthology的论文，先使用了<u><a href="github.com/allenai/science-parse">Science-Parse</a></u>去提取PDF中的文本、表格和图像，输出为json。其中包括标题、摘要文本、元数据（例如作者和年份）和论文各个部分（小标题与对应文本）组成的列表，Science-Parse还支持将图像和表格提取到图像文件和标题文本中。接着提取出论文中的任务、数据集和评估方式（Entities Extraction部分，最终结果872个任务、345个数据集、62个评估方式），最后使用<u><a href="https://www.elastic.co" target="_blank" rel="noopener">Elasticsearch</a></u>去索引论文(可以通过论文题目、摘要、元数据和论文的各个部分来索引)。  </p>
<p>在摘要生成部分：由于科技论文很长、涵盖众多主题、没节的描述不尽相同。为了确保摘要生成器对所有方面给予足够的关注，这里选择为每个部分生成一个独立的摘要。通过这种方式，我们总结出一个更短、更集中的文本，用户可以更容易地浏览，因为他们得到了论文的结构。每一个以章节为基础的总结最终都会组成一个书面总结。在ISS中，产生摘要的方法是抽取式摘要，使用了2017 SIGIR中一篇论文（Unsupervised queryfocused multi-document summarization using the cross entropy method）的算法。这个算法通过paper section与一个查询Q，以及Q中的实体和期望的摘要长度来产生最终的每部分摘要。</p>
<p>在查询搜索部分：如果一个查询过短则利用了一个已经存在的查询扩充技术来扩充查询语义。</p>
<h1 id="3-实验"><a href="#3-实验" class="headerlink" title="3.实验"></a>3.实验</h1><p>本DEMO论文实验选择了人工评估方式，找了12个NLP领域的研究者在三个任务上进行评估。<br>对于每篇论文，产生两种模型的摘要：Section-based和Section-agnostic。其中Sention-based就是我们上述介绍的方法，为每个部分生成一个独立的摘要；而Section-agnostic是使用相同算法但忽略章节部分，直接抽取出最终摘要。实验结果如下：<br><img src="/images/Papers/DemoSum/3.jpg" alt="论文题目"></p>

            </div>

            <!-- Post Comments -->
            

        </div>
        <!-- Copyright 版权 start -->
                <div id="copyright">
            <ul>
                <li>&copy;2020 北望你的安. 版权所有</li>
            </ul>
            
                <span id="busuanzi_container_site_pv">本站总访问量<span id="busuanzi_value_site_pv"></span>次，</span>
				<span id="busuanzi_container_site_uv"> 访客数 <span id="busuanzi_value_site_uv"></span> 人. </span>
			
			<br>
			<span>友情链接：<a href='http://www.demilab.cn' target='_blank'>DEMI实验室</a>&nbsp;&nbsp;&nbsp;<a href='http://zd11024.cn/' target='_blank'>ZD</a></span>
        </div>
    </div>
</body>



 	
</html>
